#利用python统计连续登录n天或以上用户  开始timestamp是ogject类型 2020-08-08 23：30：00
import pandas as pd
import numpy as np
#读取数据
df=pd.read_csv()
#处理时间数据timestamp
df['timestamp']=df['timestamp'].str.split('')][0]       #按照空格划分取第一部分
df['timestamp']=pd.to_datetime(df['timestamp'])          #转换为时间格式

#由于用户一天当中存在多次登录情况，去重
df.drop_duplicate(inplace=true)
#分组排序
df['辅助列']=df['timestamp'].groupby('role_id').rank()
#计算差值
df['date_sub']=df['timestamp']-pd.to_timedelta(df['辅助列'],unit='d') #得到日期

#
